Sommaire

1 Comparaison des autres sites de statistiques expérimentales

1.1 Résumé

Comparaison de 4 sites d’autres INS (DE, IT, BE, NL) listés sur le sites de statistiques expérimentales de Eurostat

Ce que les autres ont et le site SSPHub n’a pas

  • existe en anglais
  • téléchargement des données produites
  • présentation stable par projet, avec une page par projet permettant de savoir ce qui a été fait et est encore utilisé

Ce que le SSPLab a et les autres non

  • Beaucoup de publication open source
  • Une vision plus large que les seules statistiques expérimentales (croisement de données administratives, webscrapping) et tournée vers l’innovation méthodologique

1.2 Belgique - Statbel

  • une structure stable en trois onglets (pas toujours remplis) avec un descriptif et la présentation des principaux résultats avec des graphiques
  • 17 présentations de statistiques expérimentales par Statbel

Points forts

  • existe en anglais
  • téléchargement des données produites

Améliorations

  • Pas de publication open source
  • une vision plus large des statistiques expérimentales, incluant le croisement de données administratives (un seul à partir de nouvelles données trouvé sur 8 projets)
  • centré sur des statistiques expérimentales plus que sur des méthodes ou données innovantes : 1 seul projet sur les 10 serait considéré comme de l’innovation à l’Insee

Quelques exemples belges

Autres exemples de statistiques expérimentales

1.3 Allemagne - Destatis

Publication de données innovantes en méthode et source de données sous trois catégories :

  • short-term indicators specifically developed to represent economic developments as early as possible.

  • other indicator to reflect current non-economic developments that are relevant for society.

  • workshop reports on projects that tested new methods of data collection or evaluation, including experimental special evaluations and feasibility studies

Points forts

  • 5/8 indicateurs sur 12/14 rapports en anglais
  • fourniture de données téléchargeables
  • rapport sur l’expérimentation faite, quelque soit son résultat

Améliorations

  • peu d’innovation méthodologique

Quelques exemples allemands

1.4 Italie - Istat

Publication de données innovantes en méthode et source de données sous quatre catégories :

  • Non-standard classifications produced on the basis of the official taxonomies defined at an international level and currently used by Istat, or proposed as experimental within analysis and research activities based on microdata processing
  • New indicators produced through the integration of a multiplicity of official and non-official sources; in this case, the focus is on phenomena under investigation rather than on statistical sources used to describe them
  • Interpretation frameworks and analysis of complex phenomena obtained through the integration of official sources
  • Results of experiments on Big Data, characterised, by their very nature, by the use of non-official sources.

Points forts

  • environ 2/3 publiés aussi en anglais
  • fourniture de données téléchargeables

Améliorations

  • peu d’innovation méthodologique

Quelques exemples italiens

1.5 Pays-Bas - CBS

Site pour mettre en valeur l’innovation à CBS, aussi bien en terme de méthode que de données innovantes. Publication sous la forme de Beta products ou d’articles de recherche.

7 domaines innovants de travail, dont :

  • Extraction d’information (textuelle text mining, NLP, image, machine learning …) et stratégie gouvernementale de l’IA
  • Simplification de la collecte lors d’enquêtes (application, traitement de données personnelles) et modèles statistiques
  • Préserver la confidentialité, en lien avec le monde universitaire (federated or distributed learning, multiparty computation) ou la création de données synthétiques
  • Data engineering (réupération, integration, management, securité)

Points forts

  • quelques articles en anglais (3/10)
  • usage plus intensif de nouvelles méthodes (ML, NLP)

Améliorations

  • 2 beta produits transformés en production

Quelques exemples néerlandais

2 Propositions

2.1 Vue générale des propositions

Principes déjà validés en échanges bilatéraux (propositions concrètes ci-après)

  1. Publier une page par projet avec un tableau récapitulatif défini et si-besoin des détails en dessous, abondé par chaque personne en charge du projet.

  2. Fusionner la notion de SSPHub et SSPLab pour faire profiter nativement des projets en cours à tout le monde : le site du SSPLab est le site du SSPHub, le site du SSPHub est le side du SSPLab

  3. Abandonner l’ancien site ssplab et rapatrier les contenus encore à jour sur le site SSPHub

=> Ces propositions sont intégrées dans une version provisoire du site SSPHub

Autres

  1. Traduire les pages de blog en anglais (plus moyen terme)

Questions ouvertes à trancher :

  1. Devenir de la page transverse “Méthodologie et innovation statistique” de la DMCSI => proposition de renvoyer vers la page du SSPHub les pages reprises sur le site mais de garder les autres pages, qui dépendent d’autres unités de la DMCSI

  2. deux site de code : Que faire du gitlab du SSPLab, qui est passé sur Github ?

Être recensé sur le site Eurostat

Une fois cela fait, signaler à Eurostat l’existence du site et le faire recenser sur leur site de statistiques expérimentales

2.2 Rapatrier l’ancien site SSPHub

  • Pour chaque ressource du site :
  • Proposition d’intégrer 28 nouveaux contenus et de supprimer 19 pages. Parmi ces contenus,
    • 13 contenus en doublon avec la reprise de l’intranet
    • du contenu de blog : mapreduce, statistiques expérimentales sur le logement, disparités territoriales de consommation d’aliments gras sales et sucres …
    • des anciens événements (funathons 2021 et 2022)
    • des partenaires présent sur l’ancien intranet et pas repris sur le SSPHub
ancien site ssplab No de pages
Total pages présentes 59
Ne pas prendre sur site SSPHub 19
A intégrer 28
Déjà présent 12

Détails par page dans ce tableur Grist

Vue des propositions de page

2.3 Rapatrier les pages de l’intranet DMCSI

  • Décision sur tous les onglets de la page Méthode et innovation statistique de l’intranet DMCSI
No d’éléments
Total éléments présents 58
dont hors SSPLab (Unité qualité, etc) 23
Total éléments présents SSPLab 35
Ne pas prendre sur site SSPHub 4
A intégrer 26
dont à intégrer en doublon avec l’ancien site 13
Déjà présent 5
  • Rapatriement de tous les projets listés sur le site SSPHub sous un format standardisé

  • Au total (intranet et ancien site), 41 pages/éléments rapatriés sur le site SSPHub : 26 de l’intranet et 15 de l’ancien site.

Proposition de page par projet

  • Mots clés pour pouvoir chercher facilement sur le site
  • Structure minimale pour tous les projets comprenant
    • Explications
    • Sponsor
    • Equipe
    • Point de contact
    • Résultats
    • Lien vers le code
  • Une partie détaillée en dessous à la main
  • Chaque page est de la responsabilité de la personne responsable du projet

Cf. proposition de site

2.4 Les git

Les repos des projets sur intranet, etc sont sur trois types de logiciels Git :

Git Nombre de projets Liens repos
https://git.lab.sspcloud.fr/ssplab/ 4 https://git.lab.sspcloud.fr/ssplab/rsvero2/rsvero2
https://git.lab.sspcloud.fr/ssplab/signes-de-vie
https://git.lab.sspcloud.fr/ssplab/action-coeur-ville
https://git.lab.sspcloud.fr/ssplab/bdf
https://gitlab.insee.fr/ssplab/ 1 https://gitlab.insee.fr/ssplab/aiee2 et https://gitlab.insee.fr/ssplab/aiee2-web
https://github.com/InseeFrLab/ssphub 3
Pi, projets dont les repo ne sont pas indiqués 8

Proposition :

  • repos git.lab.sppcloud => les rapatrier sur Github/InseeFrLab
  • repos gitlab.insee.fr => vérifier absence de données internes et les rapatrier sur Github/InseeFrLab

Conclusions

  • Nicolas TOULEMONDE
  • SSPLab
  • DMCSI
  • nicolas.toulemonde@insee.Fr